查看原文
其他

Points of Significance: 对照实验设计

Points of Significance: 对照实验设计

简介


Nature methods从2013年9月开始发表月刊Points of Significance系列,该系列主要介绍统计在生物学中的应用,让读者可以更正确的理解及使用统计。有研究发现,在医学类期刊上发表的文章中,有接近半数的统计方法的使用都是不正确的,所以Nature methods推出该系列统计文章,以实用易懂的方式来介绍统计中的一些基本概念。

主要内容

        经常我们要比较两组实验的结果:实验组和对照组。对照实验设计是为了使得收集的数据能够满足我们的实验需求。在对照实验中,研究者会通过控制独立变量来研究该变量的作用,比如吃药与吃安慰剂对照可以研究药物的影响,有光照与无光照的对照可以研究光照的影响。这些变量一般被称为因素,如果一个因素有不同的取值则称为水平,比如吃药与不吃药分别为两个水平,身高的矮,中等,高是身高这个因素的三个水平。


实验设计实例

        下面我们通过一个具体的例子来说明本文内容。

        假如我们想要检测两种不同的处理对细胞反应的影响,那么我们设计实验的时候不仅需要这两种处理的数据,还需要一组对照实验的数据。在此基础上,我们假定三组实验结果标准差都为1,且对照组均值为10,而我们的实验组A和实验组B分别有6%和10%的增加,即实验组A的均值为10.6,实验组B的均值为11。每组数据抽样17组,且认为p值小于0.05为显著。如下图a所示


        上图b中展示的是三组数据的均值及95%的置信区间,而图c分别是A减C的差值、B减C的差值、B减A的差值的均值及95%的置信区间。


        从图上可以看出A/C实验对照组p值为0.15,B/A实验对照组p值为0.18都不显著,而B/C实验对照组p值为0.009显著。上图b中并不能完全的展示我们的结果,一般我们推荐使用上图c来展示,上图是差值的均值与95%置信区间,从上面可以看出,A/C均值的95%置信区间绝大部分是大于0的。按理说应该是显著的,所以我们该怎么样设计实验让他显著呢?

 

        之前我们在讲t检验时候提到过:样本数量越大,均值分布的标准差越小,t检验的时候p值会更小。所以很明显,我们可以通过增加样本量来使得有差异的两组数据在t检验的时候显著。那么有没有其他的办法来使得p值显著呢?


方差来源

        刚才我们说了,增大样本量实际上是减小了均值分布的标准差从而使得检验显著的。我们先说说方差的来源


        如上图a所示,分别是对照组和实验组,若是一个样本被测量多次,多次测量间有差异,这样的方差被称为受试者内方差。如上图b所示,若是同样的条件下的不同样本被测量,这样产生的方差为受试者间方差。受试者内方差主要是测量仪器等系统性方差,受试者间方差主要是同样条件下的分布的方差。

        我们的数据分布的方差为受试者内方差与受试者间方差的加和。如果我们使用配对实验设计,我们可以得到小一些的方差,如上图c。


        也就是说,我们也可以通过采用配对实验的方式来降低方差从而使得实验显著。


配对实验

        还是刚才的例子,但是我们这里采用配对实验的方式获取数据如下图a,利用配对t检验进行检测可以得到A/C之间p值为0.013显著,B/A之间p值0.0002显著如下图b,c。


结论

        一般情况下,我们的实验组和对照组间的均值差异是比较固定的,也就是说不是我们可以改变的。要使实验结果有意义,我们可以通过主要两种方式来实现。

1.增加样本量

2.使用配对实验


参考文献

1. Krzywinski M, Altman N. Points of view: designing comparative experiments. Nature methods. 2014;11(6):597-8.


声明:上述内容为NGSHotpot读文献整理写出,若有遗漏或错误,感谢您指出。

若有任何意见、建议、或对上述内容有疑问请发送邮件到:ngshotpot@126.com

扫描或识别下方二维码关注NGSHotpot

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存